Construction automatique de ressources lexicales pour la fouille d'opinion
نویسنده
چکیده
RÉSUMÉ. De nombreuses méthodes automatiques de fouille d'opinion s'appuient sur un lexique dans lequel à chaque entrée est associé un degré de polarité. La construction de telles ressources linguistiques est donc devenue un champ de recherche important en linguistique computationnelle. Des techniques automatiques, basées sur les similarités sémantiques entre les mots dont on veut estimer la polarité et des mots dont la polarité est connue, ont été développées ces dix dernières années et leur efficacité a été confirmée. La présente recherche propose d'étendre de telles procédures à l'analyse de n-grammes de mots et de déterminer les éventuels bénéfices apportés par cette extension. Une expérience menée sur la base d'un vaste corpus de critiques de films indique non seulement que les n-grammes semblent être des indicateurs plus fiables de polarité que les mots simples, mais aussi que leur combinaison avec ces mêmes mots simples permet une meilleure prédiction de la polarité de textes. Soulignant le caractère exploratoire et les limitations de la présente étude, la conclusion propose quelques pistes pour des recherches futures.
منابع مشابه
Comparabilité de corpus et fouille terminologique multilingue
RÉSUMÉ. Les principaux travaux en fouille textuelle privilégient communément la taille du corpus sur sa qualité. Ainsi dans le cadre de l’alignement lexical à partir de corpus comparables, les meilleurs résultats sont obtenus pour des corpus de grande taille (plusieurs millions de mots). Pour les domaines de spécialité, et pour de nombreuses paires de langues, il n’est pas possible de disposer ...
متن کاملKhiops: outil d'apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables
Résumé. Khiops est un outil d’apprentissage supervisé automatique pour la fouille de grandes bases de données multi-tables. L’importance prédictive des variables est évaluée au moyen de modèles de discrétisation dans le cas numérique et de groupement de valeurs dans le cas catégoriel. Dans le cas d’une base multi-tables, par exemple des clients avec leurs achats, une table d’analyse individus ×...
متن کاملVers une méthode automatique de construction de hiérarchies contextuelles
Résumé. Dans de nombreux domaines (e.g., fouille de données, entrepôts de données), l’existence de hiérarchies sur certains attributs peut être extrêmement utile dans le processus analytique. Toutefois, cette connaissance n’est pas toujours disponible ou adaptée. Il est alors nécessaire de disposer d’un processus de découverte automatique pour palier ce problème. Dans cet article, nous combinon...
متن کاملUtilisation de la Fouille de Données Images pour l'Indexation Automatique des Images
Cet article introduit un nouveau challenge pour la fouille de données qui consiste en la découverte de connaissances dans des collections d’images, appelé également Fouille de Données Images (Image Mining (IM)). Dans le but d’une indexation sémantique des images, nous nous focalisons sur le problème de la découverte de connaissances à partir du contenu des images d’un enesemble d’apprentissage,...
متن کاملIndexation et intégration de ressources textuelles à l'aide d'ontologies : application au domaine biomédical
Résumé : De nombreuses découvertes scientifiques sont contraintes aujourd’hui par la difficile intégration des données misent à disposition dans différentes ressources. L’utilisation d’ontologies pour indexer et intégrer les ressources de données est un moyen de valoriser la connaissance d’un domaine en facilitant la recherche et la fouille de données. Dans cet article nous présentons un mécani...
متن کاملذخیره در منابع من
با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید
عنوان ژورنال:
دوره شماره
صفحات -
تاریخ انتشار 2013